คำอธิบาย ของ การแบ่งกลุ่มข้อมูลแบบค่าเฉลี่ย k

สมมติให้มีเซตของการสังเกต (x1, x2, …, xn) โดยแต่ละการสังเกตเป็นเวกเตอร์ค่าจริงใน d มิติ การแบ่งกลุ่มข้อมูลแบบค่าเฉลี่ย k จะตัดแบ่งการสังเกตจำนวน n ครั้งให้เป็นข้อมูลจำนวน k ชุด (โดยที่ k น้อยกว่าหรือเท่ากับ n) ในเซต S = {S1, S2, …, Sk} ที่จะทำให้ค่าผลบวกกำลังสองภายในคลัสเตอร์ (within-cluster sum of squares; WCSS) มีค่าน้อยที่สุด. หรือพูดได้อีกอย่างว่า จุดประสงค์ของการแบ่งกลุ่มข้อมูลแบบค่าเฉลี่ย k คือการหาผลลัพธ์ต่อไปนี้:

a r g m i n S ∑ i = 1 k ∑ x ∈ S i ‖ x − μ i ‖ 2 {\displaystyle {\underset {\mathbf {S} }{\operatorname {arg\,min} }}\sum _{i=1}^{k}\sum _{\mathbf {x} \in S_{i}}\left\|\mathbf {x} -{\boldsymbol {\mu }}_{i}\right\|^{2}}

โดยที่ μi เป็นค่าเฉลี่ยของจุดใน Si

แหล่งที่มา

WikiPedia: การแบ่งกลุ่มข้อมูลแบบค่าเฉลี่ย k https://web.archive.org/web/20120805022051/http://... http://charlotte.ucsd.edu/users/elkan/cikm02.pdf http://www-cse.ucsd.edu/~elkan/kmeansicml03.pdf http://www.cs.cmu.edu/~efros/courses/LBMV07/Papers... https://web.archive.org/web/20130510120705/http://... http://www.stanford.edu/~acoates/papers/coatesleen... http://www.aclweb.org/anthology/P/P09/P09-1116.pdf https://web.archive.org/web/20130620125943/http://... http://intranet.daiict.ac.in/~ajit_r/IT530/KSVD_IE... http://www.maxlittle.net/publications/pwc_filterin...